杜创：从诺贝尔奖看经济学学术网络----2020年诺贝尔经济学奖的思想史解读

杜创经济学家茶座 Teahouse 2021-02-02

作者按语：经济学理论一般来说不是某个学者单打独斗、闭门造车的结果，学者间问难、相互启发不可或缺；尤其理论范式转变之际，学术网络的群体行为可能更显得关键。2016、2017年笔者先后在《经济学家茶座》发表《经济思想史上的1982年》（2016年第4期，总第74辑）、《学术网络的两种类型——续谈经济思想史上的1982年》（2017年第3期，总第77辑）两篇随笔。随笔以1982年微观经济理论六项突破性进展为例，探讨了两种类型学术网络在其中的作用，即以师徒传承为主要特征的纵向学术网络和以学者短期访问汇聚为主要特征的横向学术网络。三年过去，这两篇文章竟恰好构成了2020年诺贝尔奖的思想史注脚。承蒙《经济学家茶座》主编詹小洪老师之约，现汇总两篇文章，重发于公众号，以飨读者。

这应该是我的文章中最饱含情感的篇章了——当你谈到从业学科中自己最熟悉、最欣赏的部分，怎能保持平静！

作者简介：杜创，中国社会科学院经济研究所研究员。在《经济学家茶座》另发表《真实世界的柠檬市场》、《硅谷租房故事》、《从信息经济学视角看调查研究》等多篇随笔。

一、经济思想史上的1982年

学术发展有其独特轨迹。博弈论与激励理论成为现代微观经济学主流的过程，令人感慨。前贤筚路蓝缕、日积月累，二战后，涓涓细流才渐有长江黄河之势，到1980年代终于澎湃如汪洋大海；而1982年，恰如江河入海那一瞬间。

2020年10月，斯坦福大学教授威尔逊（Robert Willson）和米尔格龙姆（Paul Milgrom）因改进拍卖理论、发明了新的拍卖形式，荣膺诺贝尔经济学奖。追溯威尔逊和米尔格龙姆教授的学术贡献，有三篇经典论文发表于1982年。1982，实在是经济思想史上不寻常的年份：2016年诺贝尔经济学奖得主霍姆斯特朗（Bengt Holmstrom）教授也有两篇经典论文发表于1982年，展现出合约理论的非凡解释力。不仅合约理论、机制设计（拍卖理论），博弈论的许多子领域也出现了突破性进展。这一年，那些严谨的经济学模型告诉我们，纯文字推理如何可能误导思维；这一年，那些精巧的机制设计启发我们，纯学术研究如何产生巨大的市场价值；这一年，那些干净利落的均衡公式唤醒我们，纯智力探索如何带来审美愉悦。微观经济理论群星闪耀的1980年代，光芒已现。

合约理论大放异彩

1982年之前，代理人有道德风险情况下的最优合约设计已经取得了一些进展，包括霍姆斯特朗本人1979年的文章。但是，这些早期文献局限于单个代理人、一次性博弈的静态合约，不仅对现实的解释力度有限，理论解本身也不够“干净”。

我们知道，团队生产中，最后结果往往只是总体性的单一指标，每个人的付出很难度量，很容易就出现搭便车问题。因为每个人的付出有成本，这成本个人全部承受；由此对总收益的贡献，却是大家分享，私人收益小于团队收益。如果个人努力程度难以观测，必然导致人人偷懒。这问题怎么解决？1970年代，经济学家阿尔钦（Alchain）和德姆塞茨（Delmsetz）曾说，要打破预算平衡，找个外来老板监督团队工人，而且让老板成为剩余（利润）索取者，就解决了老板自身的激励问题。这方案是纯文字推导的，浅显易懂，看起来也符合现实。1982年，霍姆斯特朗写了个简单的数学模型，表明在最优合约设计下，监督功能不是必要的，外来者打破预算平衡本身才是关键[1]。

另一种复杂性：即使代理人的工作绩效是公开信息且只和自己的努力相关，如果不可验证，不能作为法庭证据，那就无法写进合约。这时候怎么激励代理人付出努力呢？人们的直觉是：要考虑重复博弈，声誉机制可以起作用！法马（Fama, 2013年诺贝尔经济学奖获得者）因此认为显性的激励合约不必要，市场竞争（隐性激励）足以鞭策经理人努力工作。这个直觉对吗？1982年，霍姆斯特朗再次用一个干净的数学模型表明[2]：不一定对。如果除了代理人道德风险问题（付出努力还是偷懒），委托人在一开始的时候不清楚代理人的能力，而且代理人自己也不太确定自己的能力，那声誉机制的作用将是有限的。在职业生涯的初期，代理人会过度努力，以诱导委托人相信自己能力很强；但随着时光流逝，代理人的能力通过工作绩效逐渐显示出来，就没有动机努力工作了。年轻人拼命工作、老资格在那摆谱，你在单位里、公司里不是总看到这现象吗？

如果有人问你：纯文字推理之外，数学模型有什么必要性？那就跟他说说霍姆斯特朗的文章吧！

机制设计走入实践

拍卖是历史悠久的商业活动，但是有意义的相关经济学理论也不过最近几十年才出现。1960-1980年代早期，经济学家维克里（Vickrey）、迈尔森（Myerson）等人以其对拍卖机制的开创性研究，先后获得诺贝尔经济学奖（1996/2007）。但是，早期拍卖理论建立在私人估价（private value）假设的基础上，难以解释很多重要的现象，对指导现实中的拍卖设计，意义也不大。所谓私人估价，就是说每个竞标者清楚标的物的价值，而且各竞标者的估价是独立的。在这样的假设下，拍卖理论的一个主要结论是：对卖者而言，四类常见拍卖（英式拍卖、荷式拍卖、一级价格密封投标、二级价格密封投标）是收益等价的，即卖者的预期收益相等。这样说，选择什么样的拍卖形式是不重要的。

私人估价模型的假设对很多拍卖品尤其是耐用品不成立。比如艺术品拍卖，竞标者的目的往往不是拍到作品置于密室独自欣赏，而是收藏下来、以待来日卖个更高的价钱，则标的物的价值取决于其他人的评价。这种相关性对拍卖结果将产生重要影响。比如，拍卖中标者可能面临“赢者的诅咒”：中标的原因恰恰是自己对标的物估价过高了！事前意识到这种可能性，竞标者在拍卖中就会表现得保守，这对卖者也是不利的。那么，怎么设计拍卖机制才能让卖者收入最大化呢？

米尔格龙姆（Milgrom）和韦伯(Weber)1982年的文章提出了一个一般性框架，比较了不同形式的拍卖[3]。文章表明，如果标的物价值同时取决于竞标者自己的评价、竞争者的评价和标的物的内在价值，则从卖者预期收入最大化的角度看，英式拍卖优于二级价格密封投标，后者又优于荷式拍卖和一级价格密封投标[4]。这很好的解释了为什么英式拍卖在现实中最常见。这篇文章之后，有现实指导性质的拍卖文献纷至沓来，许多经济学家也帮助政府等机构设计最优拍卖机制，成效显著。经济学理论反作用于商业实践、指导商业实践，在拍卖领域获得了完美体现。如果有人问你：除了“马后炮”式的解释世界，经济学有什么用？那就跟他说说拍卖理论吧！

有限期重复博弈也有声誉

稍微学过博弈论的人都知道囚徒困境，在一次性博弈中，均衡结果是两个参与人都不会选择合作；虽然事后看，合作对双方都好，但不会是均衡结果。即使重复博弈，如果只是有限期，不合作仍将是唯一结果。这和我们的日常经验似乎是相悖的：我们只有有限寿命，合作却广泛存在。

1982年，斯坦福的四位经济学家[5]克瑞普斯（David Kreps）、米尔格龙姆(Paul Milgrom)、罗伯茨(John Roberts)、威尔逊（Robert Wilson）连续发表了三篇论文[6]，分别讨论在有限期重复囚徒困境、连锁店悖论等环境里的声誉机制。这些文章以作者姓氏首字母，统称为KMRW模型，其共同的关键假设是：参与者对对手的类型有一些不确定性，对手可能非理性，哪怕这种可能性很小。比如在囚徒困境中，参与人可能有很小的概率是“老实人”，即不计较得失，一定选择合作。当然，每个参与人并不知道对手是不是“老实人”，只能通过一次次博弈中的行为，推断对手类型。这样一来，理性参与人就可能在重复博弈的开始阶段，冒充“老实人”，选择合作行为。当然在最后一期，真相会大白：“老实人”仍然选择合作，理性参与人选择背叛。关键在于：除非实际已经到了最后一期（或最后几期），参与人并不能事先确切推断最后一期的实际结果是合作还是背叛，因此在重复博弈开始阶段仍有合作的可能。

KMRW模型激发了大量后续研究。在富登伯格（Fudenberg）和梯若尔（Tirole）的经典博弈论教材中，占了整整一章的篇幅。

策略性信息传递不是“空谈”

1982年，经济学家克劳福德（Crawford）和索贝尔（Sobel）写了一篇很好玩的文章[7]，讨论了当两个人有一定的共同利益、又有利益冲突时如何实现有效的信息传递。不同于斯彭斯（Spence）的信号传递模型，克劳福德和索贝尔考虑的情境是信号传递本身没有成本，但是由于利益差异，博弈参与人在信息传递中可能有策略性行为。比如医患博弈，病人希望知道病情的真实情况并得到合理治疗，医生有点过度医疗的利益诉求，但出于各种原因，医生和病人利益也有一致性。克劳福德和索贝尔的模型表明，在这种情况下，还是有可能实现一定程度的信息传递，只不过信号常常是模糊的。

克劳福德和索贝尔给他们的模型起了个很高大上的名字：“策略性信息传递”（strategic information transmission）。不知怎么的，后来这一类模型渐渐就被称为“空谈博弈了”（cheap talk）。大约是想强调信息传递本身不需要付出什么成本；不像把教育程度作为个人能力的信号，受教育本身是有成本的。Cheap talk本身并无褒贬，不过中文译成“空谈”，却是贬义了。

“序贯均衡”横空出世

博弈论中最基本的均衡概念是纳什均衡，1950年代由纳什（John Nash）提出。经济学家长期以来很难解释为什么特定的行为会在纳什均衡中出现，常常只能诉诸于博弈参与人猜测或相信博弈会怎么进行；但只是一些非正式的讨论，或局限在均衡路径上。直到1982年，克瑞普斯（Kreps）和威尔逊（Wilson）在《计量经济学》杂志发表论文《序贯均衡》[8]，使得作为参与人选择行为基础的“信念”（belief）成为对博弈正式描述的一部分，不仅在均衡路径上，而且在非均衡路径上。该文提出的序贯均衡概念在讨价还价、重复博弈、合约理论等领域立即获得了广泛应用，例如上文提到的有限重复博弈声誉机制。

议价问题卷土重来

议价（讨价还价）是经济学中的古老问题了。简单来说，两个人讨价还价分1块钱，该怎么分？均衡结果会是什么？1950年代，纳什曾使用非合作博弈方法研究议价问题（同时也结合使用了合作博弈理论），但其模型的静态性质无法展现议价问题的丰富内涵。后续研究一直处于相对停滞状态。1982年，经济学家鲁宾斯坦（Rubinstein）在非合作博弈框架里重新研究了两个参与人的议价问题，将其表达为潜在可进行无穷次的轮流出价过程，并证明在完全信息条件下轮流出价可产生唯一一个帕累托有效的博弈均衡[9]。这个结论有意思的地方在于，出乎普通人意料，看起来任意、不可预测的讨价还价竟有唯一的结果，而且还是有效率的，这就树立了一个重要参照系（Benchmark）——如果议价是有效率的，则事前产权配置不重要（参考科斯定理）。这激发了大量后续研究，考虑各种更复杂情况的模型陆续被开发出来，尤其是分析不对称信息情况下议价均衡中的延误现象。如今，讨价还价理论已是非合作博弈理论的一大重要分支。

1994年以来，博弈论和激励理论领域诺贝尔经济学奖接踵而来:1994、1997、2001、2005、2007、2012、2014、2016、2020年奖项均与该领域高度相关。但其实，已经获奖的这些贡献，除了最近几次次（2012年以后），大都是1950-1970年代的成果。而博弈论大规模应用于经济学，尤其是激励理论的爆发式发展，是在1980年代。本文介绍的成果中部分尚未获奖，但皆是诺奖级别的。这些文章，无不在博弈论和信息经济学大框架内开辟了一个子领域，解释力丰富，可指导实践，而且文章本身也都干净利落，给人审美享受，展示出微观经济学的独特魅力。更令人惊奇的是，如此多项成就竟集中于一年之内出现！这里列出的，也只是笔者比较熟悉的领域，在整个经济学范围内看，1982年发表的经典论文可能还有很多。限于篇幅，本文只首先提出这个重要现象；至于背后的学术发展逻辑，且待来日再谈。（本文完）

二、学术网络的两种类型

——续谈经济思想史上的1982年

上次谈经济思想史上的1982年（《经济学家茶座》第74 辑），笔者曾介绍该年度微观经济理论领域取得的六项突破性进展，包括：(1)克瑞普斯(David Kreps)和威尔逊(Robert Wilson)提出“序贯均衡”概念；（2）霍姆斯特朗（Bengt Holmstrom）将合约理论推广到多代理人和动态道德风险环境；（3）米尔格龙姆(Paul Milgrom)和韦伯（Robert Weber）建立关联估价拍卖（correlated valueauction）模型的一般框架；（4）克瑞普斯、米尔格龙姆、罗伯茨（John Roberts）和威尔逊联合提出有限期重复博弈中的声誉模型；（5）克劳福德(Crawford)和索贝尔（Sobel）开创策略性信息传递模型；（6）鲁宾斯坦(Rubinstein)得出讨价还价的非合作博弈解。

上述六项进展无不在博弈论和信息经济学大框架内开辟了一个子领域，更令人惊奇的是如此多项成就竟集中于一年之内出现！具体年份或有偶然性，但20世纪70年代中期到80年代初的确是微观经济理论范式转换的关键期。当时完全竞争市场的一般均衡理论仍处于理论研究中心，但是一些年轻研究者开始应用崭新的非合作博弈理论工具来处理新问题，他们意识到完全竞争市场领域之外有大量重要的经济问题，能够借助激励与信息的思路来分析。这一转变如何发生、如何最终成为现代微观经济理论的主流，当属经济思想史上的重大研究命题。本文试从学术网络的角度，以1982年为横截面略做探讨。

纵向网络：威尔逊传统的博弈论

前文六项进展中（1）-（4）项均与斯坦福大学有关：主要贡献人当时或在斯坦福大学任职（威尔逊、克瑞普斯、罗伯茨），或博士毕业于斯坦福大学（霍姆斯特朗、米尔格龙姆）。其中灵魂人物，则为经济学一代宗师罗伯特·威尔逊教授。

罗伯特·威尔逊教授1937年生，1963年获哈佛商学院工商管理博士（D.B.A）学位，1964年之后一直在斯坦福大学商学院工作。2002年5月，威尔逊教授65岁生日之际，门下三位优秀学生霍姆斯特朗（2016年诺奖得主）、米尔格龙姆和罗斯（Alvin Roth, 2012年诺奖得主）合编了一本庆祝文集，名为《威尔逊传统的博弈论》[10]。三位编者合写的序言简要介绍了威尔逊教授的学术成就，并解释了何为“威尔逊传统的博弈论”。威尔逊教授是最早认识到“信息”和“信念”重要性的博弈论理论家之一，但是使威尔逊成为同时代经济学家中领袖人物的标志，还是其对经济理论角色的认识。威尔逊教授认为理论的价值在于解决实际问题，实践中碰到的难题正为理论家提供了研究主题。因此，“威尔逊传统的博弈论”是将博弈论作为实用工具，服务于经济学研究；而“威尔逊风格的研究”，其灵感不仅来自于对已有学术文献的广泛阅读和深入理解，更来自日常经济生活。由此容易理解，威尔逊教授的工作不仅产生了一般性的、敏锐的概念性洞见，例如“序贯均衡”；而且能为战略和设计中的复杂问题提供建议和答案，例如非线性定价、拍卖设计等。

要理解“威尔逊传统”的独特重要性，似乎还得从博弈论和微观经济理论发展的大背景中去看。博弈论的早期开拓者，如冯·诺依曼、纳什、泽尔腾等都是数学家出身，他们持续接力，到20世纪60年代奠定了博弈论的基本理论框架。进入70年代，博弈论大规模应用于经济研究渐成潮流，但这需要研究者在思路上的根本性变化，即从强调数学框架到强调实用性的转变。这个时候，就需要既懂数学、又懂经济学的领军人物出现。正当此时，威尔逊教授和他的天才学生们，霍姆斯特朗（1978年获博士学位）、米尔格龙姆（1979年获博士学位）、罗斯(1974年获博士学位)等成为这一潮流的主导者。基于这一传统我们不难理解，1982年霍姆斯特朗将合约理论拓展到多代理人、动态环境，米尔格龙姆将拍卖理论从私人估价模型拓展到关联估价（Correlated Value）模型，其来有自。

学术传统薪火相传。博弈论的威尔逊传统起源于20世纪70年代，当时其执衣钵者除霍姆斯特朗、米尔格龙姆、罗斯，知名经济学家还包括Robert W. Rosenthal，Claude d'Aspremont，Peter Cramton等。此传统至今日而势头不衰，且有蓬勃之势。兹举三例。其例一，除了文集内提到的学生（2002年之前），威尔逊门下还有一位后起之秀，Yuliy Sannikov。此君1978年生，2004年于斯坦福大学博士毕业，是威尔逊教授和Skrzypacz教授联合指导的学生。Sannikov 建立了连续时间重复博弈理论，2008年就在普林斯顿大学拿到正教授职位，2016年获克拉克奖，2016年下半年已重回母校斯坦福大学任教。其例二，2013年4月19-20日，斯坦福大学举办了一场称为米尔格龙姆节（Milgromfest）的学术活动，庆祝米尔格龙姆教授65岁生日。米尔格龙姆教授的学生中，亦有许多优秀人物，如2007年获得克拉克奖的Susan Athey（斯坦福大学教授），以及Yeon-Koo Che, Michihiro Kandori, John William Hatfield, Luis Cabral和北大光华管理学院蔡洪滨教授等。其例三，Holmstrom 长期在MIT任教，其教出的优秀学生包括2011年克拉克奖获得者Jonathan Levin，Levin目前是斯坦福大学商学院（GSB）院长。

横向网络：莫里斯和纳菲尔德学院

前文提到，1982年微观经济理论第（5）、（6）项突破性进展分别是克劳福德和索贝尔创立策略性信息传递模型，和鲁宾斯坦得出讨价还价的非合作博弈解。克劳福德1976年博士毕业于麻省理工学院，索贝尔1978年在加州大学伯克利分校获得应用数学博士学位，1982年时二人均在在加州大学圣地亚哥分校任教。鲁宾斯坦1979年从以色列希伯来大学获得博士学位，1982年时正在以色列希伯来大学任教。

从论文内容、作者履历看，上述两项进展似乎没什么关系，笔者念书时先后读过这两篇经典论文，也未发现二者有什么关联。直到去年写《经济思想史上的1982年》，再翻出这两篇文章同时阅读，竟意外有所得：在这两篇文章的致谢栏，笔者发现了很有意思的现象。两篇文章的作者在文章发表之前竟都有在牛津大学纳菲尔德学院（Nuffield College）短期访问的经历。鲁宾斯坦1979-1980年担任牛津大学纳菲尔德学院的研究员（Research fellow），而且在1982年文章致谢栏明确表示该研究是在纳菲尔德学院访问期间做出的，并特别感谢詹姆斯·莫里斯（James. Mirrlees）教授的有益评论。而索贝尔1981-1982年在牛津大学纳菲尔德学院短期访问，1982年文章致谢栏明确表示莫里斯教授在该文的完善过程中发挥了很大的作用，尤其是对文中一个主要定理的内容及证明。两篇文章都发表在《计量经济学杂志》（Econometrica），莫里斯教授当时正是这家杂志的联合主编（co-editor）。此外，致谢栏显示两篇文章都受到英国社会科学研究理事会（U.K. Social Sciences Research Council）的资助，资助项目名称为“激励、消费者不确定性和公共政策”。竟有如此巧合！

在这一系列共同因素中，我们看到了另外一位灵魂人物的作用：詹姆斯·莫里斯，当时是牛津大学教授，牛津纳菲尔德学院的fellow。莫里斯教授大名鼎鼎，经济学者大都知道其1996年与维克里（Vickrey）教授一起因在信息经济学领域的卓越贡献而获得诺贝尔经济学奖。20世纪70年代中期，莫里斯教授关于信息不对称条件下最优税收和道德风险问题的研究，可归入信息经济学最早的奠基作之一。这些成就广为人知！而对于莫里斯教授在建立学术网络、提携年轻学者方面的贡献，恐怕就并非人人皆知了。

与威尔逊教授以师徒传承为主的纵向网络不同，在莫里斯、鲁宾斯坦、索贝尔之间，则是以学者短期访问汇聚为主要特征的横向学术网络，其载体纳菲尔德学院也值得一提。我们知道，牛津、剑桥等英式大学实行学院制，在按专业划分的系之外，学生\研究人员还同时加入打破专业的学院。成立于1937年的纳菲尔德学院正是牛津大学若干这样的跨专业学院之一，学院侧重于社会科学（尤其是经济学、政治学和社会学）。除了莫里斯教授之外，诺贝尔经济学奖得主约翰·希克斯（John Hicks）、阿马提亚·森（Amartya Sen）都曾是该院的fellow。起源于应用数学的博弈论应用到社会科学领域，实为跨专业的工作，纳菲尔德学院的跨专业性质正好有利于此。（本文完）

[1] Holmström, Bengt. Moral Hazard in Teams.The Bell Journal of Economics, 1982, vol.13, no.2.

[2] Holmström, Bengt. Managerial Incentive Problems - A DynamicPerspective. In Essays in Economics andManagement in Honor of Lars Wahlbeck. Helsinki: Swedish School ofEconomics. (See also Review of EconomicStudies, 1999.)

[3] P. Milgrom and R. Weber. A Theory of Auctions and CompetitiveBidding. Econometrica, 1982, vol.50,no.5.

[4]第二个结论依赖于竞标者风险中性假设。

[5]当时Milgrom尚在西北大学。

[6] Kreps, DavidM; Milgrom, Paul;Roberts, John;Wilson,Robert. RationalCooperation in the Finitely Repeated Prisoners' Dilemma. Journal of Economic Theory, 1982: vol.27, no. 2. Kreps, DavidM; Wilson,Robert. Reputationand Imperfect Information.Journal of Economic Theory, 1982: vol. 27, no. 2. Milgrom, Paul;Roberts, John.Predation,Reputation, and Entry Deterrence.Journal of Economic Theory, 1982: vol. 27, no. 2.

[7] Crawford, Vincent P. and Joel Sobel. Strategic InformationTransmission. Econometrica, 1982,vol.50, no.6.

[8] Kreps, David M. and Robert Wilson. "SequentialEquilibria", Econometrica, 1982:vol.50.

[9] Rubinstein, Ariel. Perfect Equilibrium in a Bargaining Model. Econometrica, 1982, vol.50, no.1.

[10] Game Theory in the Traditionof Robert Wilson, (eds. B. Holmstrom, P. Milgrom, A. Roth), BE Press, 2002.

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

不要成为戾气的受害者

常德悲剧：让谴责无差别杀戮之声更加响亮一点